托马斯•尼科尔斯(Thomas Nichols)是美国海战学院的国家安全事务教授,哈佛继续教育学院兼职教授,美国参议院的前助理,纽约卡耐基委员会高级伦理和国际事务顾问,波士顿大学国际史学委员会委员,华盛顿国际战略研究中心成员。主要研究领域包括外交政策和国际安全事务,作品还有《崇高的事业》(The Sacred Cause)、《无用:核武器与美国国家安全》(No Use: Nuclear Weapons and U.S. National Security)、《毁灭的前夜:防御战时代的来临》(Eve of Destruction: The Coming Age of Preventive War)和《俄罗斯总统》(The Russian Presidency)等。
专家失灵的多种面孔
专家失灵有好几种。最无辜也是最常见的一种就是我们认为的普通的科学失败。个人甚至整个行业因为失误或领域自身的局限把重要的问题搞错了。他们观察一个现象,或是考察一个问题,想出理论和解决方案,然后进行检验。有时候他们做对了,有时候他们弄错了。整个过程里通常会遇到很多死胡同和失败的实验。有时候错误没有被发现,甚至被其他专家进一步加深。这就是一代美国人是如何避免食用鸡蛋而增肥的原因;这就是为什么美国第一次试射卫星以发射台的巨大爆炸而告终;这就是为什么外交政策的顶尖专家推测德国的和平统一在未来几十年都不太可能实现,却不得不在庆祝的烟火绽放在自由柏林的上空时重新审视自己的观点。科学也是在实践中学习的。美国在1945年发明了核弹,但世界各地的科学家和研究员却花了10年时间进行爆炸测试才对电磁脉冲有了更好的理解。电磁脉冲是核爆炸引起的一种隐性影响,会破坏电子系统。而公众直到1962年才知道电磁脉冲的存在,美国在太平洋的一次测试导致数百公里外的夏威夷路灯灭掉,电话故障,科学家们已经猜想到会有这种效应,但影响范围还是超出了他们的预估。绝大多数人,包括专家,对这种失灵都是无能为力的,因为这就是科学和学术不可或缺的一部分。普通人对模棱两可的东西感到不适,他们要的是答案,而非警告。但科学就是一个过程,而不是一个结论。科学主题本身就是要根据一套细致的规则不断进行测试,在这个过程中,现有的理论会被更优的理论替代。民众不能期待专家永远不犯错,如果专家能达到这般精准,他们一开始就无须搞研究和做实验了。如果政策专家能未卜先知或无所不知,那政府就不会陷入赤字,战争也只有在疯子的煽动下才会爆发。有时候,专家的失误也会带来有益的结果,但这种失误受到的对待与那些劳民伤财的错误却相去甚远。比如说,当科学家发明口服避孕药的时候,其实他们本来是要搞清楚如何帮助女性避免意外怀孕的。他们并没有想着要降低卵巢癌的风险——但很明显某些控制生育的药物达到了这个目的,而且效果显著。对某些女性来说,口服避孕药是有风险的,但对另一群女性来说,同样的药物或许能延长生命。当然,如果生育控制药物只会增加癌症风险,我们就会扼腕叹息又一次科学的失败,但这种积极的副作用在半个世纪前无人知晓,类似的情况还有很多。类似的,有专家预测20世纪50年代末会发生全面的国际核武器军备竞赛,他们错了。但他们之所以会错,至少有部分原因在于他们低估了自己努力限制核武器扩散的效力。约翰·F.肯尼迪总统担心到20世纪70年代世界上会有多达25个核武国家。(到了2017年,只有10个国家跨过这道门槛,其中有一个国家——南非——还曾经声明放弃这种武器。)[8]肯尼迪的预测是基于最佳专家团队的建议,也不是不可能或不合常理的,但是,在这同一批专家所提倡的政策协助下,未来核武国家的数量降低了。专家无法保证最终结果。他们无法承诺永远不犯错,也无法承诺不受人人皆有的缺陷所累,这些缺陷支配着一切人类研究。他们只能承诺制定规则和方法来减少犯错的概率,做到远低于普通人犯错的频率。如果我们接受专业人士的工作所带来的裨益,那也得接受不那么完美的事情,甚至可能是一定程度的风险。然而,其他形式的专家失灵就更令人忧心了。比如,当专家试图把自己的专业知识从一个领域延伸到另一个领域,他们可能会犯错。这不仅是错误的触发器,也是令其他专家十分恼火的事情。有些情况下,当艺人——当然是他们那个领域的专家——把艺术和生活混为一谈,开始对一些复杂的问题发表看法,这就是明显的跨专业入侵了。还有些时候界限没那么清晰,问题就变成了“相对专业”。一个生物学家不是医生,但总体而言,相较普通人,生物学家能更好地理解医学问题。当然,这也不是说生命科学领域的任何人对这个领域的任何问题总是比其他人更有见地。比如说,一个勤勉的人花时间阅读糖尿病相关资料,可能就比一个植物学家更精通糖尿病的课题。一个专业人士如果专业学识深入,但知识面窄,那在自身领域以外的问题上,也就未必比其他人更有才学。一个领域的教育和文凭并不能保证一个人精通所有领域。然而,当专家留在自己的领域里,却不甘于诠释,开始预测,这就是另一个问题了。强调预测就是在破坏科学的基本规则——科学的任务是解释,不是预测——而社会作为一个客户要求预测多过解释。更糟糕的是,普通人很容易认为预测失败就表示专业知识毫无价值。就这一点而言,专家面临着一个艰巨的任务,因为无论学者强调过多少次,他们的目标是解释世界,而不是预测离散事件,民众和政策制定者还是青睐预测。(即便专家内心很明白,往往还是乐意效劳。)这就是专家和客户之间自然但无法克服的紧张关系,大多数人喜欢预测问题并加以避免,而不是事后解释。一个诊断的承诺,即便带有揣测性质,也总比验尸的绝对确定性要更受欢迎。最后还有彻底的欺骗和渎职。这是最罕见但最危险的一种。在这种情况中,专家为了自己的目的(通常是野心家妄图捍卫自己的次品)刻意造假。他们一方面希望民众不会抓个现行,另一方面则希望同行不会注意到,或是把他们的欺骗归类到诚实的错误。这种最极端的情况是最好应对的,所以我们就从这里开始。当专家存心不良
科学家在21世纪初经历了艰难的几年。科学期刊的论文撤回数量达到历史最高比例。学术欺诈或行为不端现在看来都成了日常。专家欺诈不难定义,但难以识别。如果有研究者或学者伪造研究成果或冒充专家的人谎称自己获得某个领域的资格证书或执照,那就是明显的行为不端了。[科学家用一个非常全面的缩写“FFP”来形容这种行为,意思是“伪造(fabrication)、篡改(falsif ication)或抄袭(plagiarism)”。]这种行为不端可能难以辨别,因为这需要其他专家找到线索,普通人不具备剖析科学研究的能力,最多也就是可能凑近墙上的文凭证书仔细看看是不是真的。有时候专家不是专家。人们对自己的文凭撒谎,而且做得厚颜无耻。现实中的“超级伪装者”弗兰克·阿巴内尔(Frank Abagnale)在20世纪60年代完成过这种大胆华丽的造假[之后事迹被拍成电影《猫鼠游戏》(Catch Me If You Can)],阿巴内尔的行为包括冒充飞机驾驶员和医生。还有一种更普遍但更微妙的欺诈,就是有些人的确是专家,但他们用伪造的荣誉或夸大其词来加强资历。他们也许会声称自己是某专业协会的成员,或参加过某专家小组或研讨会,或是受过勋或获过奖,或是其他伪造的修饰包装,这些人通常只有在一些契机导致其他人去查阅他们的记录时才会被抓包。当真正的专家说谎,他们危害的不仅仅是自己的专业,还有客户——社会——的福祉。他们对专业知识的威胁有两种表现:一种就是欺骗所带来的直接后果;另一种就是当他们被识破时这种行为不端对社会信任的腐蚀。这就是为什么(除了对撒谎和欺诈的法律制裁以外)专业组织、学术基金会、智库、学术期刊和大学保留对这种恶意渎职的一些最严厉惩罚。出乎大众意料的是,这些惩罚的确存在。很多美国人都误以为研究员和大学教师不可能遭到解雇。这不是毫无根据的观念,因为解雇一名终身教授的确很难。虽然很多教授的合同里都有“反公德行为”条款,但21世纪的社会准则已经把标准降到很低,一个教授在课堂或私人生活中的行为几乎很难触及那条红线,以至于让学校终止任期。像对学生进行人身威胁或完全不出现在工作岗位上这种明显会导致解雇的过错可能还是会触发解聘的后果,但就个人行为而言,通常几乎所有情况都会被忽略掉。然而,学术行为不端仍然是很多学校的红线。学术自由保障了人们有权表达不受欢迎或与众不同的观点,但这不是给制造马虎草率或刻意误导人的研究开绿灯。比如,科罗拉多大学解雇了沃德·丘吉尔(Ward Churchill)——一个把纽约“9·11”恐怖袭击受害者比作纳粹的讲师——他们解雇他不是因为他是一个不近人情的蠢货,而是因为他的评论引发人们去关注他的“学术著作”,结果发现其中有部分抄袭。当然,丘吉尔声称自己是政治偏见的牺牲品。他把自己作为科罗拉多州雇员遭解职的事一直上诉到科罗拉多州最高法院,最后输掉官司。毫无疑问,丘吉尔的履历之所以会被仔细查阅,是因为他的政治观点。丘吉尔就解职事件提起上诉也是基于这一点,辩称他的抄袭是一些无心的过失,只是因为他持有争议的观点,才被大家发现。但这样的立场本身就令人震惊:一定要发生把双子塔遇难者称为“小阿道夫·艾希曼”(little Adolf Eichmann)这样的事,就像丘吉尔所为,才能去仔细查阅一个教授的学术著作?声称抄袭被发现只是因为这个大学讲师用令人作呕的言论来费力博取关注,这样辩解很苍白。丘吉尔一案从某种程度上来说是独一无二的,很重要的一点是因为它受到公众的极大关注。大多数学术界渎职的案例都未被公众察觉。2014年的同性婚姻研究,包含了大规模数据造假,是一个特例,并且因为其结论的潜在政治影响力而受到大量关注。大多数学术研究都不会像一个宣称可以说服人们走出恐同情绪的研究那么有趣,所以也不会得到同等程度的关注。不过,关注度低,不代表这些案例不严重。2011年,一名博士后研究者拿着美国政府的拨款在哥伦比亚大学开展研究,结果被发现在阿尔茨海默病相关的细胞生物学研究方面造假。这个研究者同意三年内不接受任何联邦政府拨款,但在他的不端行为被发现之前,他的文章已经被其他科学家引用了不下150次。2016年,一名西班牙研究员也因为其心血管疾病方面的研究涉嫌欺诈而遭到供职机构解雇。还有更戏剧化的案例,一个名叫安德鲁·韦克菲尔德(Andrew Wakefield)的医生发表了一个把疫苗与自闭症联系起来的争议性研究,2010年在英国被吊销医生执照。英国医疗部门表示吊销韦克菲尔德的执照不是因为他支持了一个充满争议的主题,而是因为他违反了很多基本的科学行为准则。英国医学总会(UK General Medical Council)发现韦克菲尔德“曾经在未获得伦理委员会批准的情况下对儿童进行侵犯性研究,侵犯了儿童的临床利益,没有披露经济利益冲突和不当资金”。[9]和沃德·丘吉尔一样,韦克菲尔德的支持者辩称他是猎巫行动[10]受害者。但败坏名誉的研究和行为不端不是一回事。比如,主要的艾滋病否定论者之一彼得·迪斯贝格(Peter Duesberg)虽然面临指控说他涉嫌学术行为不端,但还留在加州大学伯克利分校,学校就这项指控在2010年对他展开了调查并驳回了指控。然而,我们还是绕不过这个问题:大量出版的科学研究有问题,轻则不可靠,重则造假,而且数量多到不容忽视。说起来可能会对普通人聊可安慰,我们之所以知道这些行为不端在发生,是因为所有领域的科学家都供认不讳。2005年的一项调查问到科学家是否有过不诚实的研究行为,大约2%的科学家自认至少伪造、篡改或“修饰过”一次数据,14%的人说曾目睹同事有过此类行为。当被问及严重行为不端,但还没达到完全造假这样滔天大罪时,1/3的受访者承认他们涉及不那么明显但还是值得商榷的行为,比如忽略与自己观点冲突的发现。超过70%的人表示曾在同事身上见过同样的行为。[11]大多数学术行为不端对普通人来说都是不易察觉的,因为太无聊了。大多数学术期刊的文章撤回都是因为一些冷门话题研究中的不起眼错误或失实叙述,这与人们在《永不妥协》(Erin Brockovich)或《局内人》(The Insider)这样著名的电影里看到的大型欺诈的戏剧性故事不同。相对来说,自然科学似乎麻烦多多,但这可能是因为这些领域的研究更容易检测。的确,自然科学家可能会说他们的文章撤回是职业责任和监督的表现。具有最高影响力的科学和医学期刊——例如《新英格兰医学杂志》(New England Journal of Medicine)——文章撤回率较高。不过,谁也不确定是为什么。[12]可能是因为有更多人核查结果,如果是这样,那就是个振奋人心的趋势。也有可能是因为更多人走捷径渗入顶级期刊,如果是这样,那就是个令人沮丧的事实了。还有可能是在声名显赫的期刊上发表文章的效应:读者越多,越有可能被别人引用到研究中去,顺藤摸瓜,就会被人发现行为不端。任何科学研究的黄金标准就是看能否被复制或至少被重构。这就是为什么学者会用注释:不是为了防止抄袭——虽然的确有这个作用——而是让同行能够跟随它们的脚步,看看他们能否得出同样的结论。如果科学家篡改数据,那他们的结论就很难被复制,因而会破坏,甚至伪造研究。不过,这种查证首先要假设有人会费心去复制结论。普通的同行互审不包括重做实验,而是推荐人会在假定论文符合基本的研究标准和流程的情况下来阅读。他们主要是判断课题是否重要,数据的质量够不够高,文中的论据是否能支撑结论。当然,像化学或物理这样的自然科学似乎更主张复制的要求,而像社会学和心理学这样的社会科学研究往往依靠的是受试者,因而也更难复制。至少自然科学家可以声称有更清晰的标准:如果有人说某种塑料在100摄氏度融化,那其他任何人只要有同样的材料和一个本生灯,就可以查证这个发现。当100个学生志愿者受邀参与一项研究或训练时,事情就变得困难多了。研究结果可能是一个实时的概况,或是某个区域的印象,或是偏离了原来的方向。研究的设计本应对这些问题做出解释,但唯一知道答案的方式就是试着复制实验。这就是一个研究团队在心理学领域打算做的事。至少结果是让人意外的。正如《纽约时报》2015年所报道的,一项试图复制100项研究的“艰苦卓绝”的努力,其结果发表在三个顶尖的心理学期刊上,研究发现一半以上的结论都没能经受住重新检验。这项分析是由心理学家完成的,其中很多人都是自愿花时间来复核他们认为重要的著作……经审核的研究被视为核心知识的一部分,科学家借此来理解性格、关系、学习和记忆的动态。治疗学家和教育者依靠这些发现来引导决策,但既然这么多研究自身都有问题,那这些著作背后的科学依据就不得不让人怀疑了。[13]这样的结果令人担忧,但这算欺诈吗?差劲的研究不等于行为不端。在很多案例中,问题不在于在重做研究的时候导出了不同的结果,而是这些研究从本质上来说就是“不可复制的”,也就是说他们的结论也许是有用的,但其他研究者无法以同样的方式来重做这些人类调查。事实上,心理学研究也许都不算是差劲的研究。另一群学者随后又检验了这个调查——毕竟科学就是这样运转的——并得出结论,用哈佛学者加里·金(Gary King)的话说,这就是“彻头彻尾的不公平,甚至不负责任”。金指出,当复制是一个极其重要的问题,应该让学者“魂牵梦萦”,“那要说所有社会心理学家都在胡编乱造就不对了”。[14]整个科学事业,包括对反驳的反驳,都在正轨上:在《科学》(Science)的扉页上,专家还可以继续评估所有的论据,并对其展开进一步分析。那么,自然科学是不是比社会科学有更多的次品或赝品被揭露出来?也许不是。当癌症研究者试图复制自身领域的研究,他们也遇到了心理学家和其他专家同样的问题。Slate网站撰稿人丹尼尔·恩贝在2016年报道了一组生物医药研究,这些研究出现了与心理学研究同样的“复制危机”。他指出,据估计“多达一半的研究结果是建立在不可靠的基础上,在其他实验室可能是无法复制的。这些癌症研究不仅没有找到治疗方法,甚至都没能提供任何有用的数据”。[15]就复制而言,横亘在他们面前的障碍与困扰社会学家的如出一辙:凌乱、时间推移、无法精确复制第一次实验时的条件等等。我们在这里讨论的有欺骗性研究,也有只是粗制滥造的作品,这个主题太庞杂了,很难切入,但学术界“复制危机”的源头不是只有纯粹的欺诈,还有完美复制在物质和时间上存在的限制,以及其他问题,比如对拨款的监管不足,学术机构有发表作品的要求(无论多微不足道),这些给研究者造成了巨大压力,学者们的论文或研究一旦出版,往往就会把从前的作品打包装箱,扔到一边。社会科学和人类学方面的研究尤其难复制,因为它不是基于实验流程,而是专家对独立作品和事件的解读。一本文艺评论的书就是书如其名——评论。它不是科学。不过,专家的判断则需要关于这个学科的深厚知识。同样,研究古巴导弹危机不同于自然科学实验。我们无法反复重演1962年10月发生的事情,所以一个作者检视了古巴导弹危机的后果并写出文章,呈现的是一个专家对一次历史事件的分析。这样的研究结论可能漏洞百出,但这只是给进一步探讨提供了素材,算不上职业行为不端。在社会科学和人类学中还有一些引人瞩目的完完全全的学术诈骗案例。2000年,埃默里大学历史学家迈克尔·贝里尔因为一本名叫《武装美国》(Arming America)的书获得了哥伦比亚大学享有盛名的班克罗夫特奖(Bancroft Prize)。贝里尔在书中声称揭穿了一个关于拥枪思想的谬论,据他说,美国人拥枪的思想不是植根于早期殖民时代的经历,而是受近一个世纪后的其他影响形成的。这项研究认为私人拥有武器在早期的美国并不常见,因此立即在读者中引起两极分化。这个研究本来不会被人察觉,但因为探讨的主题是拥枪,控枪支持者和拥枪团体立刻就贝里尔的观点选边站,故而引来细致密切的审查。其他学者试图找到贝里尔研究所依托的信息来源,但他们的结论是贝里尔要么是误用了信息,要么是杜撰出来的。哥伦比亚大学撤回了班克罗夫特奖。埃默里大学也展开了调查,发现贝里尔的错误有一些可能是因为能力不足,但还有一些是学术诚信的问题,这一点无可回避。此后不久,贝里尔辞去了职位。最初合作的出版商也终止了这本书的出版,不过后来又被一家小型商业出版社重新发行了。2012年,一个名叫戴维·巴顿(David Barton)的作者出版了一本关于托马斯·杰斐逊(Thomas Jefferson)的书。巴顿没有专业历史学背景,他之所以名噪一时,主要是因为他在福音运动中的声望。(2005年,《时代》称他为美国最具影响力的25个福音派传教士之一。)他的书赢得了保守派领袖的赞誉和支持,包括2012年总统参选人麦克·哈克比(Mike Huckabee)和由历史学家转型为政治人物的纽特·金里奇(Newt Gingrich)。和贝里尔的枪支研究一样,巴顿的作品因为政治影响力和作者的声望受到相当大的关注。这本书的标题毫不隐晦——杰斐逊的谎言:揭露你一直相信的托马斯·杰斐逊。巴顿在书中说,现代历史学家不仅污蔑了杰斐逊的私生活,还忽视了他的很多思想其实是支持现代保守派观点的。考虑到杰斐逊是欣赏法国大革命的,而且他后来与自由主义者结盟(这与他的保守派死对头约翰·亚当斯正好相反),这个观点非常大胆。大多数专业学者都不理会这本书,对他们来说,这本书就是一个业余历史学爱好者和一个非学术的宗教出版社的合作产物。无论如何,这本书的目标读者也不是学者,而是渴望读到这些内容的那群人。巴顿大获成功:《杰斐逊的谎言》登上了《纽约时报》畅销书榜。这本书的准确性很快就受到质疑,提出质疑的不是某个研究型大学的无神论自由主义者,而是宾夕法尼亚州一个小型基督教学校格罗夫城市学院的两名学者。经过仔细审查后,巴顿的很多主张都站不住脚。这本书后来被历史新闻网(History News Network)读者票选为“最不值得信赖的纸质书”,但更具毁灭性的是这本书的出版商认为这本书实在是漏洞百出,所以终止发行。《大西洋月刊》撰稿人兼法学教授加勒特·埃普斯(Garret Epps)对这一事件做出尖刻的批评,他说:“巴顿的书大多是自助出版的,永远不会被撤回。但是基督教学者和一家基督教出版社的斥责是他永远挥之不去的羞耻烙印。”[16]在所有这些案例中,欺骗和行为不端都被发现了。不过,普通人对于最后的清算并不太关心,这也合情合理。最根本的问题在于各领域的研究是否可信。在某种意义上说,这是个错误的问题。一个课题的成败与否,几乎不会由一次研究决定。普通人不会去仰仗细胞研究的某一个项目的结果。如果有一组研究集结起来得到一种药物或一种治疗方法,而某一项研究隶属其中,这个研究本身也会触发一连串的研究来审视相关的安全性和效能。伪造一项研究还有可能,伪造数百项研究,并且制造出完全欺骗性或危险的结果,那就另当别论了。同样,在公共政策方面,专家的权威不是靠一项研究确立的。即便一个学者因为一本书或一篇文章受到政策圈的关注,他/她的影响力也不是由科学复制作品的可能性决定的,而是由作品所提出的观点决定的。社会科学与自然科学一样,任何单项研究,如果没有其他专家的再次审查,鲜少会影响到普通公民的生活。然而,任何领域的欺骗都会浪费时间,推迟进展。就像一组复杂的方程式中如果早早埋下错误,后面的计算就会陷入困境,欺骗或行为不端会耽搁整个项目,直至有人发现是谁搞错——或刻意欺瞒——事实。当然,如果这样的事情公之于众,随之而来的就是行为不端的范围和影响这一类法律问题,尤其是当这些项目花的是公众的钱的时候。本文选自《专家之死》,标题为编者所加,注释从略,有少量文字调整。特别推荐购买此书仔细研读。该选文只做介绍相关研究和著作的参考,不得用于商业用途,版权归原出版机构所有。
—End—
从欧洲到世界:面向21世纪的大历史观|J.M.罗伯茨
---------------------------------
混乱时代 阅读常识
长按二维码关注!